查看原文
其他

小牛翻译云平台上线索拉尼语

聚焦机器翻译的 小牛翻译
2024-09-09
据统计,世界上共有7000多种语言,只有中文、英文等少数语言间具备丰富且高质量的平行双语语料资源,绝大多数语种间(如中文与库尔德语)没有大规模的平行语料库。如何在数据资源稀缺的情况下训练出高性能的机器翻译引擎,就变成了一件非常具有挑战性的任务。

一封来自伊拉克库尔德地区用户的邮件


随着小牛翻译云平台海外市场的不断扩展,国际用户数量也在不断攀升,目前已经遍及亚非欧美各洲。今年9月中旬,小牛翻译团队收到一封来自伊拉克库尔德地区用户的邮件,他对索拉尼语机器翻译服务表达了迫切需求:

“我懂库尔德语和英语,对阿拉伯语和波斯语也有一些了解。小牛翻译引擎把英语翻译成阿拉伯语和波斯语时表现出的性能很好,但英语翻译成库尔德语(库尔曼吉语)的性能不是很好。我知道一个原因是你们没有库尔德语言(库尔曼吉语和索拉尼语)的相关双语平行语料库。
我希望小牛翻译能很快支持索拉尼语。……
 
面对用户需求,小牛翻译的技术研发部门迅速做出反应,在短短两个月时间内,通过与用户多轮互动交流,完成了中文与索拉尼语的引擎研发,并于近日上线,得到了用户的充分肯定。 

库尔德索拉尼语


库尔德语是库尔德人使用的语言,属印欧语系-伊朗语族-西伊朗语支,其句子的语序和波斯语基本相同,是主-宾-谓结构。库尔德语的使用人数大约在2000-4000万之间,他们聚居在伊朗、伊拉克、叙利亚和土耳其等国。

据维基百科介绍,库尔德语由三种不互通的语言构成,分别为库尔曼吉语(北库尔德语)、索拉尼语(中库尔德语)和佩赫勒瓦尼语(南库尔德语)。其中,库尔曼吉语和索拉尼语是库尔德语中最常见的两种形式,这两种方言使用者约占所有库尔德语使用者总人口的75%。
 
库尔德语使用者分布图(图片来源:伯克利大学语言中心)

库尔曼吉语采用经修改过的拉丁字母书写,使用人数在1500-1700万之间,主要分布于土耳其东南部、叙利亚北部、伊拉克北部和伊朗西北部。索拉尼语是伊拉克的官方语言之一,其拼写体系是上世纪20年代在波斯字母基础上创造的,使用人数在900-1200万之间,分布于伊拉克库尔德斯坦和伊朗西部。
 

索拉尼语拼写形式(图片来源于维基百科)

面向中东地区用户小牛翻译云平台新增索拉尼语


中东地区是两洋三洲五海之地,是中国“一带一路”建设的重点地区。中国是中东第一大贸易伙伴,也是中东地区能源领域的重要外国投资者和工程承包劳务市场的重要服务提供商,未来中国和中东各国在能源领域、制造业领域和设施联通方面有广阔的合作空间。
 
目前,在上线索拉尼语之后,小牛翻译云平台可支持阿拉伯语、土耳其语、波斯语、希伯来语、库尔曼吉语、索拉尼语等中东地区六大语言在内的304种语言,用户可在云平台上文本翻译、文档翻译、API调用服务中应用索拉尼语。

小牛翻译云平台上索拉尼语到中文的翻译示例(原文来源:https://www.kurdistan24.net/)
 
“用机器翻译助力世界语言交流无障碍”一直是小牛翻译的美好愿景。此次新上线索拉尼语,是朝着实现这一宏大梦想迈出的又一步。未来,小牛翻译将继续以中文为核心加大对各国语言尤其是小语种的研究和探索,支持更多的语种,不断提升翻译品质,为全球用户提供最懂中文的机器翻译引擎“发动机”!



关于我们



专注于机器翻译技术基础研究48年,拥有百余人的机器翻译产学研团队,自主研发以中文为核心的NiuTrans机器翻译系统,支持304种语言随心互译。通过丰富的应用与功能,为用户提供机器翻译服务全栈式解决方案,致力于为机器翻译产业化应用提供基础平台,帮助企业级用户在国际业务中消除语言障碍。


直播回顾|黄国平博士与交互式机器翻译

西藏那曲科协系统管理培训班一行赴小牛翻译参观交流

小牛翻译参展第二十届中国制博会,助力装备制造业数字化转型

继续滑动看下一个
小牛翻译
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存